Une démonstration d’un crawler intelligent pour les applications Web

نویسندگان

  • Muhammad Faheem
  • Pierre Senellart
چکیده

We demonstrate here a new approach to Web archival crawling, based on an applicationaware helper that drives crawls of Web applications according to their types (especially, according to their content management systems). By adapting the crawling strategy to the Web application type, one is able to crawl a given Web application (say, a given forum or blog) with fewer requests than traditional crawling techniques. Additionally, the application-aware helper is able to extract semantic content from the Web pages crawled, which results in a Web archive of richer value to an archive user. In our demonstration scenario, we invite a user to compare application-aware crawling to regular Web crawling on the Web site of their choice, both in terms of efficiency and of experience in browsing and searching the archive.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Recherche sémantique basée sur l'ontologie modulaire et le raisonnement à base de cas

Résumé : Les ontologies ont contribué à l’apparition des moteurs de recherche sémantiques. Parmi ceux-ci, les moteurs de recherche contextuels se basent sur un nombre déterminé d’ontologie de domaine. La recherche dans ces moteurs est limitée à un domaine bien déterminé. Ainsi, au dessus d’un crawler, plusieurs techniques peuvent être développées pour ajouter à tout moteur de recherche traditio...

متن کامل

Définition d'un agent conversationnel assistant d'applications internet à partir d'un corpus de requêtes

RÉSUMÉ. Les Agents Conversationnels Assistants sont une sous-classe des Agents Conversationnels Animés, dédiée à la Fonction d’Assistance pour les applications et services du grand public. Les nouvelles applications Internet sont un domaine particulièrement intéressant pour étudier les agents assistants pour le grand public. Nous avons donc développé un logiciel orienté Web, appelé le « toolkit...

متن کامل

Une méthode de rétro-ingénierie des processus métier basée sur un métamodèle multi-vues

RÉSUMÉ. Dans le contexte actuel de la mondialisation et dans le besoin croissant de l’automatisation du travail, la modélisation des processus métier devient une nécessité pour non seulement comprendre et maîtriser les processus mais également prévoir tout changement et construire ainsi une structure flexible. Pour les organisations qui possèdent des processus métier opérationnels non modélisés...

متن کامل

Démonstration combinatoire de la formule de Harer–Zagier

Résumé. On donne une démonstration combinatoire directe de la formule de Harer–Zagier sur les nombres εg(m) de manières d’obtenir une surface de Riemann de genre g par identification par paires des côtés d’un 2m-gone. Cette formule est la clé combinatoire nécessaire pour le calcul de la caractéristique d’Euler de l’espace de modules des courbes de genre g. La méthode ici développée reprend l’ap...

متن کامل

Evaluation d'associations sémantiques dans une ontologie de domaine

Résumé : Dans une ontologie de domaine, une association sémantique entre deux entités (concepts, attributs d’un concept) est une représentation d’un chemin ou d’un lien sémantique (LS) indirect entre elles. Un défi prometteur pour le Web sémantique est de développer des méthodes pour découvrir des données fortement liées dans un nombre important d’associations sémantiques rassemblées à partir d...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013